期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. ODTrans: 适用于云数据存储系统的容错的事务协议
程序;李红燕;王腾蛟;杨冬青
北京大学学报(自然科学版)    DOI: 10.13209/j.0479-8023.2015.011
2. 基于实体识别的在线主题检测方法
付艳,杨冬青,唐世渭,伍伟,王腾蛟,高军
北京大学学报(自然科学版)   
摘要828)      收藏
为提高在线主题的检测效率,作者提出了一种基于实体识别技术的在线主题检测方法,利用新闻报道中的命名实体快速判断新到达报道与历史主题的关系,从而减少对报道间文本相似度的计算。实验结果显示,本文提出的方法能够在不牺牲检测准确率的基础上,显著提高在线主题检测的效率。
相关文章 | 多维度评价 | 评论0
3. ArithRegion——一种压缩XML的索引结构
包小源,唐世渭,吴泠,杨冬青,宋再生,王腾蛟
北京大学学报(自然科学版)   
摘要615)      收藏
XML在数据交换中的应用越来越广泛,但由于标记引入而使其空间膨胀较大,对传输及存储资源耗费严重。压缩后的XML数据容量明显减少,但怎样基于压缩后的XML数据直接进行高效的查询处理,当前研究工作较少。以反向算术压缩为基本压缩算法,提出针对XML数据库中压缩XML文件的索引结构ArithRegion,基于该索引结构,可高效处理形如//element1/element2/…/elmentm的查询。
相关文章 | 多维度评价 | 评论0
4. 移动环境中的最大移动序列模式挖掘
马帅, 唐世渭, 杨冬青, 王腾蛟, 高军
北京大学学报(自然科学版)   
摘要659)      收藏
在移动通信环境中,移动序列模式挖掘对于有效的提高位置管理的服务质量具有重大的意义。移动序列模式挖掘和传统的序列模式挖掘是不同的,首先,前者需要考虑更多的时间因素;其次,移动序列模式中的项之间是连续的,因为关心移动用户的下一次移动情况。本文提出了一种挖掘移动序列模式的新技术:聚类的思想引入到移动序列模式挖掘来处理移动历史的时间离散化,并且提出了一个高效的PrefixTree算法来挖掘移动序列。性能研究表明,PrefixTree算法优于PrefixSpan-2算法。
相关文章 | 多维度评价 | 评论0